AI资讯新闻榜单内容搜索-Claude 3.5

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Claude 3.5
Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

AI的运作始终笼罩着一层神秘的「黑箱」迷雾。这种不透明让AI有时会「胡说八道」,甚至故意撒谎。Anthropic刚刚推出了一项突破性研究,用类似大脑扫描的技术,深入Claude 3.5 Haiku的「脑子」,揭开了它运行的一些秘密。

来自主题: AI资讯
9770 点击    2025-03-28 17:45
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

本文介绍了当前最受科研人员青睐的AI模型,推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonnet和开源明星Olmo 2,它们各有优劣,为科研人员提供了多样选择。

来自主题: AI资讯
10671 点击    2025-03-25 11:53
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

斯坦福和普林斯顿研究者发现,DeepSeek-R1生成的自定义CUDA内核,完爆了o1和Claude 3.5 Sonnet,拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorch Eager基线,但GPU编程加速自动化的按钮,已经被按下!

来自主题: AI技术研报
11001 点击    2025-02-27 16:17
OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI刚刚发布SWE-Lancer编码基准测试,直接让AI模型挑战真实外包任务!这些任务总价值高达100万美元。有趣的是,测试结果显示,Anthropic的Claude 3.5 Sonnet在「赚钱」能力上竟然超越了OpenAI自家的GPT-4o和o1模型。

来自主题: AI技术研报
9020 点击    2025-02-19 15:19
编程不再是专业技能!Replit「Agent」引爆编程革命,零基础也能轻松上手

编程不再是专业技能!Replit「Agent」引爆编程革命,零基础也能轻松上手

编程不再是专业技能!Replit「Agent」引爆编程革命,零基础也能轻松上手

Replit凭借创新的AI编程平台「Agent」,在短短半年内实现了5倍的收入增长。通过采用Claude 3.5 Sonnet模型和多智能体架构,Replit为编程行业带来了前所未有的革新,推动了一个人人皆可参与的编程时代。

来自主题: AI资讯
7586 点击    2025-02-14 18:45
杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

刚刚,大模型竞技场榜单上再添一款国产模型——来自阿里,Qwen2.5-Max,超越了DeepSeek-V3,以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。

来自主题: AI资讯
7964 点击    2025-02-05 11:19
通用Coding Agent不可能好用,Code Review能力最难被AI替代?35岁程序员的春天来了 | 万有引力

通用Coding Agent不可能好用,Code Review能力最难被AI替代?35岁程序员的春天来了 | 万有引力

通用Coding Agent不可能好用,Code Review能力最难被AI替代?35岁程序员的春天来了 | 万有引力

AI 编程工具的发展令人目不暇接。从年初 Devin 这款被称为“首个真正的 AI工程师”的产品发布,到年中 Anthropic 在 Claude 3.5 Sonnet 模型推出「Artifacts」功能的重大突破,再到 Cursor、Windsurf 等新一代 IDE 的崛起,AI 正在重塑程序员的工作方式。

来自主题: AI资讯
2961 点击    2025-01-20 20:20
最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

“欧洲版 OpenAI” Mistral 的代码模型 CodeStral,又上新了! 而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐,共同位列 Copilot 竞技场第一名。

来自主题: AI资讯
8207 点击    2025-01-14 15:42
纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

Aria-UI通过纯视觉理解,实现了GUI指令的精准定位,无需依赖后台数据,简化了部署流程;在AndroidWorld和OSWorld等权威基准测试中表现出色,分别获得第一名和第三名,展示了强大的跨平台自动化能力。

来自主题: AI技术研报
9987 点击    2025-01-09 10:54